中山大学突破:AI实现精准图像语义搜索
这项由台湾中山大学的吴仁迪、林余晏和杨慧芳领导的研究团队发表于2025年8月的期刊文章,提出了一种名为SQUARE的全新图像检索框架。有兴趣深入了解的读者可以通过论文编号arXiv:2509.26330v1查询完整论文。
这项由台湾中山大学的吴仁迪、林余晏和杨慧芳领导的研究团队发表于2025年8月的期刊文章,提出了一种名为SQUARE的全新图像检索框架。有兴趣深入了解的读者可以通过论文编号arXiv:2509.26330v1查询完整论文。
由于雾霾会影响所捕获遥感图像的质量,同时限制后端视觉应用的性能,因而文章提出一种双重注意力多尺度残差去雾网络。首先,重建大气散射模型,可结合大气光值与透射率求取大气光幂; 然后,利用端到端的深度学习模型完成遥感图像去雾,该网络包含浅层特征提取模块、深层数据提取
计算机视觉技术作为AI的“眼睛”,是当前人工智能领域的重要研究方向。近日,计算机视觉领域三大顶级学术会议之一的国际计算机视觉大会(ICCV 2025)顺利举行。会议期间,合合信息联合上海交通大学等机构主办了首届VQualA视觉质量评估研讨会,同时,为了推动建立
光明网讯计算机视觉技术作为AI的“眼睛”,是当前人工智能领域的重要研究方向。近期,计算机视觉领域三大顶级学术会议之一的国际计算机视觉大会(ICCV 2025)举行,其间,合合信息联合上海交通大学等机构主办了首届VQualA视觉质量评估研讨会,为推动建立智能文档
据悉,福建理工大学的科研人员报道了焊接缺陷检测:基于深度学习的图像处理与缺陷形成机理。相关论文以“Weld Defect Detection: Deep Learning-Based Image Processing and the Mechanisms of
斯坦福大学和 Adobe 研究院联手,用 pi-Flow(基于策略的流模型)技术,让 200 亿参数的文本到图像大模型,在 4 步之内就生成了媲美教师模型的高质量、高多样性图片。
这项由腾讯混元基础模型团队完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.23951v1。团队开发出了名为HunyuanImage 3.0的原生多模态模型,这是目前世界上最大、最强的开源图像生成模型。有兴趣深入了解技术细节的读者可以通过该
当我们谈论AI绘画时,大多数人想到的可能是那些需要大量计算资源、生成速度较慢的扩散模型。然而,由DP Technology的柯国霖和北京大学的薛辉共同完成的这项研究,正在彻底改变这一现状。这项名为"超球面潜在空间改进连续标记自回归生成"的突破性研究发表于202
模型 图像 dp technolo dptechnology 2025-10-22 21:59 4
常言道:“耳听为虚,眼见为实。”然而在图像环绕的时代,我们是否还能相信眼睛所接收的信息?我们是否真正读懂了视觉蕴藏的内涵?
近日,一位名为CPU Duke的CPU收藏家,以一种专属的浪漫方式,分享了Intel 8008处理器史上最清晰、细节最丰富的芯片特写(Die-shot)图像。
这项由韩国Nota公司的李俊沅(Jewon Lee)、申旭洙(Wooksu Shin)、杨承民(Seungmin Yang)等研究团队开发的创新技术于2025年9月发表在计算机视觉领域的预印本论文中,论文编号为arXiv:2509.21991v1。感兴趣的读者
这项由上海AI实验室、中科大、香港中文大学等多家知名机构联合完成的研究发表于2025年1月,论文标题为"CAPRL: STIMULATING DENSE IMAGE CAPTION CAPABILITIES VIA REINFORCEMENT LEARNING
斯坦福大学和 Adobe 研究院联手,用 pi-Flow(基于策略的流模型)技术,让 200 亿参数的文本到图像大模型,在 4 步之内就生成了媲美教师模型的高质量、高多样性图片。
遥感,是一个高度应用驱动的领域。如今,借助视觉语言模型深入分析遥感图像,正催生前所未有的能力:灾害救援队可瞬间评估灾区建筑损毁,环保机构能精准追踪非法排污与森林砍伐。
随着大航海时代的到来,数以万计的中国瓷器开始大规模销往欧洲。陶瓷传统装饰图像不断融合新的西方元素和审美偏好,使得陶瓷成为参与全球化进程的“世界商品”,在海上丝绸之路中发挥着重要作用。以中国外销青花瓷为主的多种东方元素逐渐流行于欧洲静物画、风俗画等作品中,反映了
近年来,微软在产品和服务中大量依赖OpenAI的人工智能模型。除了Phi系列的小型语言模型外,微软并未自主开发出任何重大AI模型。今年8月,微软首次发布了两款自主研发的AI模型:MAI-Voice-1和MAI-1-preview。而今日,微软又宣布了其第三款自
在人工智能快速发展的今天,我们见证了一个令人兴奋的突破。ByteDance Seed团队的研究人员陆彦佐、夏鑫、张曼琳、匡华峰、郑坚彬、任雨夕和肖雪峰在2025年9月发表了一项开创性研究,提出了名为Hyper-Bagel的统一加速框架。这篇论文发表在arXiv
AI生图标杆如FLUX.1、GPT-Image,已经能生成媲美摄影大片的自然图像,却在柱状图、函数图这类结构化图像上频频出错,要么逻辑混乱、数据错误,要么就是标签错位。
这项由阿里巴巴Qwen团队完成的突破性研究发表于2025年8月,论文编号为arXiv:2508.02324v1。这是一个划时代的图像生成模型,首次让AI真正掌握了在图片中准确渲染复杂文字的能力,特别是在中文字符的处理上实现了革命性突破。
外文数据,中文界面,中英文检索支持。高清学术图像图文数据,科学、医学、艺术和创意内容特色,涵盖自然科学、人文社科、传媒、医学等学科领域。浏览查阅、下载高清图文数据,满足教学、学习、研究和创作训练等需求。